1
За пределами чат-ботов: Архитектура автономных агентов
EvoClass-AI005Лекция 5
00:00

Добро пожаловать в переход от пассивного потребления ИИ к активной организации работы с ИИ. Чтобы понять «цифрового сотрудника», мы сначала должны отличать обычного чат-бота от автономного агента. В то время как традиционный взаимодействие с ОЯИ является реактивным — опираясь на простую ввод → выводсхему — автономный агент функционирует в рекурсивном цикле, определяемом формулой:

$$ \text{Цель} + \text{Рассуждение} + \text{Инструменты} = \text{Результат} $$

1. ОЯИ как центральный процессор

В этой архитектуре крупная языковая модель (ОЯИ) выступает в роли «мозга» или ЦП. Она обеспечивает основную логическую и языковую функциональность, но чтобы работать как сотрудник, ей требуется поддержка фреймворка, позволяющего сохранять состояние и выполнять задачи.

2. Три столпа архитектуры агента

Чтобы этот «мозг» был эффективным, он зависит от трёх столпов:

  • Планирование: Разбиение сложных целей на подзадачи.
  • Память: Сохранение контекста из предыдущих взаимодействий и долгосрочных данных.
  • Действие: Выполнение задач в цифровом мире через инструменты.

Мы больше не просто задаём запросы — мы создаём систему, которая воспринимает окружающую среду и корректирует себя при возникновении ошибок.

Структура логики агента
Вопрос 1
Что представляет собой «мозг» автономного агента в этой архитектуре?
База данных
Крупная языковая модель (ОЯИ)
Пользовательский интерфейс
Вопрос 2
Какой из столпов отвечает за разбиение сложного проекта на выполнимые подзадачи?
Действие
Память
Планирование
Вызов: Определение поведения агента
Проанализируйте рабочий процесс автономного агента.
Вы просите ИИ найти три рейса в Нью-Йорк, выбрать самый дешёвый и составить электронное письмо своему менеджеру.
Шаг 1
Определите этап «рассуждений» в этом рабочем процессе.
Решение:
Рассуждения происходят тогда, когда агент сравнивает цены трёх рейсов и выбирает самый дешёвый на основе критериев пользователя.